피처 엔지니어링 2

새로운 피처를 만드는 것이 어떻게 좋은 예측 모형을 만드는데 도움이 되는가? 다음의 R 코드는 데이터 dat를 생성한다. 이때 설명변수는 x1에서 x10은 상관관계 0.1인 표준정규분포를 따른다. 실제 데이터생성모형은 다음과 같다. \[y = 3 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_{10} x_{10} + e,\ \ e \sim \mathcal{N}(0,1)\] 정확한 모형을 알고 있다면 자료를 모형에 … 피처 엔지니어링 2 계속 읽기